Bienvenida

  • ¡Bienvenidos al curso de Modelos de Regresión y Series de Tiempo!
  • Instructor: Fernando Salcedo Mejía Eco, Ms
  • Escuela de Transformación Digital - ETD | Programa de Ciencia de Datos
  • Fecha: Junio 2024

Acerca del curso

  • Objetivo: Introducir los conceptos fundamentales de los modelos de regresión, series de tiempo y las habilidades técnicas y prácticas modernas para su aplicación.
  • Metodología: Combinación de teoría y práctica con ejemplos en R y Python.

Objetivos de aprendizaje

  • Formular modelos de regresión lineal, bondad de ajuste, evaluar supuestos e interpretación de resultados.
  • Detectar componentes de tendencia, estacionalidad y ciclos en series de tiempo, aplicar transformaciones de estacionariedad y modelos ARIMA.
  • Ajustar y diagnosticar modelos de volatilidad (ARCH/GARCH) para datos financieros.
  • Comparar y seleccionar modelos utilizando criterios de información (AIC, BIC) y validación cruzada.
  • Trabajo colaborativo en un proyecto final integrador de regresión y series de tiempo usando R o Python. Comunicación efectiva de resultados para audiencias técnicas y no técnicas.

Contenido del curso

  • Introducción a los modelos de regresión y series de Tiempo
  • Fundamentos de regresión y modelos estacionarios
  • Modelos ARMA y ARIMA
  • Modelos de series temporales no estacionarias
  • Modelos de suavizado exponencial y pronósticos
  • Modelos de volatilidad (ARCH/GARCH)
  • Indentificación, estimación y diagnóstico de modelos
  • Modelos de intervención y detencción de Valores atípicos
  • Modelos de Predicción Avanzados con IA : LSTM y Prophet
  • Proyecto final integrador

Recursos adicionales

  • Material del curso disponible en GitHub: Repositorio del curso
  • Lecturas recomendadas disponible en biblioteca física y digital de la universidad:
  • Enders, Walter (2004). Applied econometric time series. Wiley.
  • Ao, Sio-Iong (2010). Applied time series analysis and innovative computing. Springer.
  • Palit, Ajoy K. (2005). Computational intelligence in time series forecasting: theory and engineering applications. Springer.
  • Golyandina, Nina (2020). Singular Spectrum Analysis for Time Series. Springer Berlin Heidelberg.
  • Ghysels, Eric (2001). The econometric analysis of seasonal time series. Cambridge University.
  • Box, George E. P. (1994). Time series analysis forecasting and control. Prentice-Hall.
  • IntechOpen (2024). Time Series Analysis: Recent Advances, New Perspectives and Applications.
  • Liu, Timina (2020). Time Series Analysis Using SAS Enterprise Guide. Springer Singapore.
  • Cipra, Tomas (2020). Time Series in Economics and Finance. Springer International Publishing.
  • Franses, Philip Hans (1998). Time series models for business and economic forecasting. Cambridge University Press.
  • Hyndman, R.J., & Athanasopoulos, G. (2021) Forecasting: principles and practice, 3rd edition, OTexts: Melbourne, Australia. Available at: OTexts.com/fpp3.
  • Hyndman, R.J., Athanasopoulos, G., Garza, A., Challu, C., Mergenthaler, M., & Olivares, K.G. (2025). Forecasting: Principles and Practice, the Pythonic Way. OTexts: Melbourne, Australia. Available at: OTexts.com/fpppy.

Evaluación

  • Participación en clase y ejercicios prácticos en clases: 30%
    • Por cada hora de clase una actividad grupales o individuales.
  • Exámenes parciales: 40%
    • Dos exámenes parciales durante el curso.
  • Proyecto final integrador: 30%
    • Comienza en el tercer cohorte.
    • Desarrollo de un proyecto final que integre los conceptos aprendidos en el curso.
    • Presentación y defensa del proyecto en una feria de datos.

Políticas del curso

  • Asistencia: Se espera asistencia regular a las clases y participación activa.
  • Entrega de trabajos: Todos los trabajos deben entregarse en las fechas establecidas.
  • Honestidad académica: Se espera que todos los estudiantes mantengan los más altos estándares de integridad académica. El plagio y la copia no serán tolerados.
  • Uso de software: Se utilizarán R y Python en Jupyter Notebooks (.ipynb) para prácticas y proyectos del curso.
  • Entregas de trabajos y proyectos en PDF y HTML generados desde Jupyter Notebooks (.ipynb).
  • Uso de IA Generativa: El uso de herramientas de IA generativa está permitido para apoyo en la comprensión de conceptos y generación de código, siempre y cuando se cite adecuadamente y no se utilice para la realización completa de tareas o exámenes.

Paquetes de software requeridos

  • R y Python
  • Paquetes están listados en los archivos r-requirements.txt y py-requirements.txt en el repositorio del curso.
  • Se recomienda crear un entorno virtual para instalar los paquetes necesarios.
  • R : Usar renv::restore() para instalar paquetes desde r-requirements.txt. Asegurarse de tener renv instalado. Además, instalar el kernel de R en Jupyter con IRkernel::installspec().
  • Python : Usar pip install -r py-requirements.txt para instalar paquetes desde py-requirements.txt.
  • Levantar JupyterLab con jupyter lab en la terminal desde el entorno virtual.

Información de contacto

  • Microsoft-Teams y correo electrónico : fsalcedo@utb.edu.co
  • Horario de oficina: Martes y Jueves de 3:00 PM a 5:00 PM por Microsoft-Teams.

Concepto y definición de series de tiempo

Concepto clave

  • Una serie de tiempo es una secuencia de datos medidos en puntos sucesivos en el tiempo, generalmente a intervalos uniformes.
  • Las series de tiempo son comunes en diversas disciplinas, incluyendo economía, finanzas, meteorología, ingeniería y ciencias sociales.

  • Formalmente \(Y_t : \{y_1, y_2, \dots , y_T\}\) donde conocemos los valores de la serie hasta \(T\).

¿Por qué estudiar series de tiempo?

  • El objetivo principal del análisis de series de tiempo es modelar la estructura temporal de los datos para entender su comportamiento y hacer pronósticos futuros, clave para una planificación eficaz y eficiente.

  • Según Hyndman y Athanasopoulos (2021) las condiciones para estudiar las series de tiempo con fines de pronóstico son:

  • Qué tanto entendemos los factores que mueven la serie

  • Cuánta información tenemos sobre la serie

  • Qué tanto se parece el futuro al pasado

  • Si los pronósticos pueden afectar aquello que intentamos pronosticar. (expectativas)

  • Aplicaciones prácticas en diversos campos:

    • Finanzas: precios de acciones, tasas de interés.
    • Economía: PIB, inflación, desempleo.
    • Meteorología: temperaturas, precipitaciones.
    • Salud pública: tasas de enfermedades, hospitalizaciones.
    • Industria: control de calidad, mantenimiento predictivo.

inversiones a largo plazo hasta operación diaria (plantas eléctricas, call centers, inventarios). - Horizonte variable: de años a minutos, según el caso. - Clave para una planificación eficaz y eficiente. - La predictibilidad depende de: - Comprensión de factores causales. - Cantidad y calidad de datos disponibles. - Estabilidad (que el futuro se parezca al pasado). - Reflexividad (si el pronóstico influye en el sistema). :::

Regresión Lineal: Definición

Concepto clave

La regresión es una herramienta estadística utilizada para modelar y analizar la relación entre una variable dependiente y una o más variables independientes.

  • La regresión es una herramienta que permite estimar la media condicional a una o más variables de una variable dependiente (\(Y\)) dado un conjunto de otras variables llamadas regresoras, variables condicionales o covariables (\(X\)).

  • Tenemos \(n\) obervaciones de una variable de interés \(Y\) y un set de \(k\) covariables \(X_{1}, X_{2}, ..., X_{k}\). El modelo lineal para \(Y\) será:

\[ E(Y|\mathbf{X}) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \varepsilon \]

Donde:

  • \(E(Y|\mathbf{X})\) es el valor esperado de \(Y\) dado el conjunto de covariables \(\mathbf{X}\)
  • \(\beta_k\) estima el cambio promedio esperado en \(Y\) ante cambios en \(X_k\)
  • \(\beta_0\) es el intercepto de la regresión
  • \(\varepsilon\) errores de estimación

Esquema visual de una regresión lineal

Diferentes tipos de covariables, diferente significado de \(\beta_k\)

  • Si tanto \(Y\) como \(X\) son continuos \[\beta_k = \frac{\Delta Y}{\Delta X_k}\] \(\beta_k\) = El cambio promedio esperado en \(Y\) ante un cambio en \(X\)

  • Si \(Y\) es númerica y \(X\) es dicotómica \[\beta_k = E(Y|X = 1) - E(Y|X = 0)\] \(\beta_K\) = Es la diferencia promedio esperada en \(Y\) cuando \(X = 1\) respecto a \(X = 0\)

Ejemplo 1. Interpretación de una regresión